沙龙回顾 | 王聪：推荐系统中的行为偏差与纠偏策略研究

光华BA 北大光华商业分析 2023-11-16

收录于合集 #北大光华BA行业沙龙 53个

PKUGSM BUSINESS ANALYTICS

2021年11月27日下午，北大光华2021级商业分析硕士班学术沙龙委员会举办了秋季学期第三场学术沙龙。活动有幸邀请到光华管理学院管理科学与信息系统系助理教授王聪老师，作主题为“推荐系统中的行为偏差与纠偏策略研究”的分享。

引言 Introduction

近年来，推荐系统已广泛应用于电子商务、社交媒体等领域，其所依赖的训练数据主要是平台记录的用户行为数据。但由于用户行为数据中常常蕴含着用户的自选择偏差，由此形成的训练样本通常是有偏的。直接使用有偏数据进行推荐信系统的训练将使得推荐系统的推荐效果受到影响，甚至反而会通过与用户的交互进一步强化偏差。本次报告将重点从推荐方法设计的角度，介绍我们在训练数据存在偏差的情况下的纠偏策略设计的研究。

传统分析方法

传统有如下三种推荐算法：

Memory-based method：通过用户和对象的不同特征计算相似度，给相似度较高的用户推荐相同的商品。

Model-based method：之前流行使用latent factor model（隐式因子模型）算法，现在更流行基于深度学习的模型。

Hybrid method：混合型方法是融合了Memory-based和Model-based两种方法的思想提出的算法。

数据类型也可以分为两类：

Explicit（显式）：例如消费者点赞、评分等由消费者主动发动得到的数据。

Implicit（隐式）：例如在平台的行为数据、是否点击、是否加入购物车等留在平台上的用户足迹。

有偏数据

消费者在购买一件商品时会经历搜索、浏览、加购、比较、购买、写评价的过程，在这个购买链条上的不同环节会出现不同类型的数据偏差。主要可以分为以下三类：

Exposure bias：平台对不同的消费者呈现的是不同的商品，消费者有偏差地选择商品

Acquisition bias：在不完整的信息情境下下，消费者只会购买正效应的商品，由此产生购买性的偏差

Under-report bias：消费者在购物后是否评分取决于对商品的满意程度。一般情况下消费者不会发表评论，只会在遇到极差或者极好商品的情况下才会发表评论。因此商品的评价（点赞、踩）不是同分布等概率，是有偏的训练样本

此外，还存在着明显的Self-selected user behavior（自选择偏差）。如果使用传统的统计模型对这种有偏的训练样本做训练，最后得到的一定是有偏的结果，这也是信息茧房产生的部分原因。如果依据有偏的结果做推荐系统，则会误导消费者做出错误的决策，也会降低消费者评分的可信度。

遇到的挑战

最主要的挑战是解决以上的三类偏差从而得到一个无偏的训练结果。此外还有一个挑战是如何评价模型结果（performance evaluation）。因为如果测试集也是一个有偏的样本，那么根据此样本得到的评价指标也会失真。

这是一个信息系统IS 、营销Marketing 、统计Statistics 、计算机科学 CS四门学科交叉的领域，需要融合不用的专业知识。

解决方法

由于这些选择偏差（Selection biases）是一个非随机缺失数据的问题(missing not at random problem MNAR），即数据的缺失本身就依赖于缺失值的自身，因此可以借鉴统计学中的三种方法：

1.Joint likelihood approach: 通过建立联合似然函数估计参数，但问题是缺少一个合适的分布，难以建立一个稳定的模型。

2.Imputation-based approach: 通过差值法和矫正的迭代估计参数，但会导致估计量有偏且标准误差较大，估计量不稳定。

3.Inverse propensity score(IPS) approach: 通过因果推断方法的估计参数，但是消费者不正确的倾向本身会导致模型的效果差强人意。在估计消费者倾向和最小化预测误差之间的权衡也是此方法的问题所在。

最终选择了Joint Likelihood Approach，通过部分用户的观测数据和模型，反推参数，最后估计真正的underlying rating。其中参数估计使用EM算法（Expectation Maximization Method），通过数值方法得到一个稳定的参数估计。

模型评价

1. 该研究所提出的模型在评分去偏的性能上具有优越性；

2. 对产品评价高或低的用户倾向于发布评价，而对产品持中性态度的用户发布评价的意愿则较低。由于模型假设确实的评分往往是较低的分数，该研究所提出的方法更善于消除上偏的评分；

3. 通过与其他多种模型的严格对比，在基于误差和基于排名的测度下，该研究提出的方法在用户的评分预测、购买预测方面都优于常用最新模型。

未来展望：进一步考虑其他类型的样本偏差，例如在消费者浏览阶段的popularity bias（流行性偏差），self-selection bias（选择偏差），以及在加入购物车阶段的 conformity bias（一致性偏差）等。

嘉宾简介

王聪，北京大学光华管理学院管理科学与信息系统系助理教授。于清华大学经济管理学院取得管理学博士学位，于北京大学信息管理系取得本科学位，曾在Carnegie Mellon University（卡耐基梅隆大学）从事博士后研究工作。

文稿丨王子昕排版丨刘城彬审核丨宋雨衡

往期回顾

｜沙龙回顾 | 张颖婕：浅谈商业应用研究中的人机协同

｜沙龙回顾 | 赵永鹏：浅谈隐私计算技术在国内的发展现状与趋势

｜沙龙回顾 | 张英广：资产定价浅谈

持续关注北大光华商业分析

第一时间掌握项目信息

长按“上图”识别二维码，关注北大光华商业分析

继续滑动看下一个

一把短刀，怎么就让他连捅18人？！

向杨大市长道歉

向不容妄议的杨市长道歉

以色列搞大了：伊朗说要直接出兵参战

黄晓菁，这位杭州泰隆银行女员工自爆视频火了，带给我们那些思考？

沙龙回顾 | 王聪：推荐系统中的行为偏差与纠偏策略研究

您可能也对以下帖子感兴趣

一把短刀，怎么就让他连捅18人？！

向杨大市长道歉

向不容妄议的杨市长道歉

以色列搞大了：伊朗说要直接出兵参战

黄晓菁，这位杭州泰隆银行女员工自爆视频火了，带给我们那些思考？

生成图片，分享到微信朋友圈

沙龙回顾 | 王聪：推荐系统中的行为偏差与纠偏策略研究

您可能也对以下帖子感兴趣